經典機器學習
歡迎來到《人工智慧概念》(COMP5511)第6課。本課程將理論基礎與實際的演算法實現相連結。儘管現代人工智慧常強調深度學習,但經典機器學習仍是資料分析的基石。這些演算法具有高度的可解釋性與計算效率,使其成為結構化資料與產業標準分析的首選方案。
1. 監督式學習
此範疇涉及在一個標記資料集上訓練模型,讓演算法學習輸入特徵與特定目標輸出之間的關係。這使模型能準確地預測結果對新出現的未見資料進行準確預測。
- 決策樹: 將資料分割成分支以達成分類或數值判斷的模型。
- 支援向量機(SVM): 找出最佳超平面以最大化不同資料類別間的邊距。
2. 非監督式學習
這些演算法分析未標記的資料以發現隱藏的模式、結構或群組,且無需事先了解輸出應為何種形式。主要技術包括:
- K-均值聚類: 根據特徵相似性,將資料點分組成 K 個獨立群組。
- 主成分分析(PCA): 一種降維技術,用於簡化複雜資料,同時保留其關鍵變異性。
可解釋性與複雜度之比較
經典機器學習的一大優勢在於其透明性。與「黑箱」式的深度學習模型不同,像決策樹這樣的演算法讓人類能追蹤預測背後的精確邏輯,這對於醫療或金融等高風險領域至關重要。
Scikit-learn 實作流程